Un modèle et une algèbre pour les données semi-structurées
نویسنده
چکیده
Semi-structured data are the core of new information systems. Developing dedicated tools is an important issue. This paper describes the basis of an architecture for the manipulation of semi-structured data. A conceptual data model is presented, it is based on labelled trees and its purpose is to provide the user with a view of data. A logical model and an associated algebra are also proposed; they are the first step towards the definition of a query language and a data warehouse for semi-structured data. This model is based on dynamic definition of regions over a document.
منابع مشابه
Modèle conceptuel pour l'analyse multidimensionnelle de documents
Résumé. OLAP et les entrepôts de données sont utilisés pour l’analyse de données transactionnelles. De nos jours, avec l’évolution d’Internet et le développement de formats d’échange de données semi-structurées comme par exemple XML, il est possible de considérer les documents comme source d’analyse. En conséquence, un environnement d’analyse multidimensionnel adapté à ce type de données est né...
متن کاملOptimisation des approximations de probabilité des requêtes en XML probabiliste
XML probabiliste est un modèle probabiliste pour les bases de données incertaines semi-structurées, avec des applications telles que l’intégration incertaine de données, l’extraction d’informations ou le contrôle probabiliste de versions. Nous explorons dans ce travail une solution efficace pour l’évaluation des requêtes tree-pattern avec jointures sur ces documents, ou, plus précisément, pour ...
متن کاملSLEMC : Apprentissage semi-supervisé enrichi par de multiples clusterings
Résumé. La tâche de classification supervisée consiste à induire un modèle de prédiction en utilisant un ensemble d’échantillons étiquetés. La précision du modèle augmente généralement avec le nombre d’échantillons disponibles. Au contraire, lorsque seuls quelques échantillons sont disponibles pour l’apprentissage, le modèle qui en résulte donne généralement des résultats médiocres. Malheureuse...
متن کاملInteropérabilité sémantique libérale pour les services et les objets
Résumé. Le Web des données promeut l’utilisation de RDF comme modèle pour les données structurées sur le Web. Cependant, la majorité des services Web consomment et exposent principalement du CSV, JSON, ou XML, des format non-RDF. Il est peu probable que tous ces services se convertissent un jour aux formats RDF existants. Ceci est d’autant plus vrai dans le contexte du Web des objets, puisque l...
متن کاملKalinahia. Modèle de qualité de service pour les applications multimédia reconfigurables
RÉSUMÉ. L’un des défis actuels des systèmes d’information est d’assurer la transmission de données semi-structurées telles les données multimédia dans un environnement distribué et ubiquitaire c’est-à-dire pervasif. Ils doivent alors garantir aux utilisateurs une qualité de service assurant aussi bien l’accessibilité aux données quelles que soient les conditions matérielles et la disponibilité ...
متن کامل